基于融合的质量评估已成为一种有力的方法,可以从单独实现较低性能的质量模型中开发高性能质量模型。这种算法的一个突出的例子是VMAF,该算法已被广泛用作与SSIM一起视频质量预测的行业标准。除了推进最先进的工作外,还必须减轻使用一组异质质量模型所带来的计算负担。在本文中,我们通过在一个公共转换域上计算出人类视觉系统的通用转换域来统一“原子”质量模型,并提出了Funque,这是一种融合统一质量评估者的质量模型。我们证明,与最先进的Funque相比,由于计算共享,Funque在与主观得分和效率的相关性方面都有显着改善。
translated by 谷歌翻译
We study mechanism design with predictions for the obnoxious facility location problem. We present deterministic strategyproof mechanisms that display tradeoffs between robustness and consistency on segments, squares, circles and trees. All these mechanisms are actually group strategyproof, with the exception of the case of squares, where manipulations from coalitions of two agents exist. We prove that these tradeoffs are optimal in the 1-dimensional case.
translated by 谷歌翻译
In this paper we propose new probabilistic and dynamic (adaptive) strategies to create multi-method ensembles based on the Coral Reefs Optimization with Substrate Layers (CRO-SL) algorithm. The CRO-SL is an evolutionary-based ensemble approach, able to combine different search procedures within a single population. In this work we discuss two different probabilistic strategies to improve the algorithm. First, we defined the Probabilistic CRO-SL (PCRO-SL), which substitutes the substrates in the CRO-SL population by {\em tags} associated with each individual. Each tag represents a different operator which will modify the individual in the reproduction phase. In each generation of the algorithm, the tags are randomly assigned to the individuals with a similar probability, obtaining this way an ensemble with a more intense change in the application of different operators to a given individual than the original CRO-SL. The second strategy discussed in this paper is the Dynamical Probabilistic CRO-SL (DPCRO-SL), in which the probability of tag assignment is modified during the evolution of the algorithm, depending on the quality of the solutions generated in each substrate. Thus, the best substrates in the search process will be assigned with a higher probability that those which showed a worse performance during the search. We test the performance of the proposed probabilistic and dynamic ensembles in different optimization problems, including benchmark functions and a real application of wind turbines layout optimization, comparing the results obtained with that of existing algorithms in the literature.
translated by 谷歌翻译
This paper is a technical overview of DeepMind and Google's recent work on reinforcement learning for controlling commercial cooling systems. Building on expertise that began with cooling Google's data centers more efficiently, we recently conducted live experiments on two real-world facilities in partnership with Trane Technologies, a building management system provider. These live experiments had a variety of challenges in areas such as evaluation, learning from offline data, and constraint satisfaction. Our paper describes these challenges in the hope that awareness of them will benefit future applied RL work. We also describe the way we adapted our RL system to deal with these challenges, resulting in energy savings of approximately 9% and 13% respectively at the two live experiment sites.
translated by 谷歌翻译
已经开发了增强学习(RL)技术来优化工业冷却系统,与传统的启发式政策相比,提供了可观的节能。工业控制中的一个主要挑战涉及由于机械限制而在现实世界中可行的学习行为。例如,某些操作只能每隔几个小时执行一次,而其他动作可以更频繁地采取。如果没有广泛的奖励工程和实验,RL代理可能无法学习机械的现实操作。为了解决这个问题,我们使用层次结构的增强学习与多种根据操作时间尺度控制动作子集的代理。我们的分层方法可以在现有基线上节省能源,同时在模拟的HVAC控制环境中保持在安全范围内的限制(例如操作冷却器)。
translated by 谷歌翻译
辅助抗菌处方的人工智能(AI)提出了重大的道德问题。利用与AI驱动的系统一起利用道德框架,同时考虑特定的复杂性,可以支持道德决策以应对抗菌抗性。
translated by 谷歌翻译
我们提出了一个混合工业冷却系统模型,该模型将分析解决方案嵌入多物理模拟中。该模型设计用于增强学习(RL)应用程序,并平衡简单性与模拟保真度和解释性。该模型的忠诚度根据大规模冷却系统的现实世界数据进行了评估。接下来是一个案例研究,说明如何将模型用于RL研究。为此,我们开发了一个工业任务套件,该套件允许指定不同的问题设置和复杂性水平,并使用它来评估不同RL算法的性能。
translated by 谷歌翻译
在医疗保健中使用人工智能(AI)的一个适当的道德框架已成为该技术越来越广泛地部署的关键。人工智能的进步具有提高个人水平上结果预测精度的承诺。然而,与任何复杂的人类相互作用一样,将这些技术添加到患者 - 阵容的相互作用中具有潜在的陷阱。尽管医生一直必须仔细考虑其行为的道德背景和含义,但详细的审议可能并没有跟上。我们在医疗保健互动中使用了一个共同但主要的挑战,披露坏消息(可能即将死亡),以说明杰里米·本瑟姆(Jeremy Bentham)在18世纪开发的“ Felicific Colculus”的哲学框架如何有及时的准Quantitative Quantitative AI时代的应用。我们展示了如何使用这种道德算法来评估七个相互排斥和详尽的领域,是否可以在道德上证明AI支持的作用是合理的。
translated by 谷歌翻译
即使自动编码器(AES)具有无标签的学习紧凑表示的理想特性,并且已广泛应用于分布式(OOD)检测,但它们通常仍然很熟悉,并且在检测正常的异常值中被错误地使用并被错误地使用。异常分布是强烈重叠的。通常,假定学习的歧管包含关键信息,这对于描述训练分布中的样本很重要,并且离群值的重建导致较高的残余错误。但是,最近的工作表明,AE在重建某些类型的OOD样品方面可能会更好。在这项工作中,我们挑战了这一假设,并研究了自动编码器在提出两个不同任务时实际学习的内容。首先,我们提出了两个基于FR \'Echet Inception距离(FID)的指标和受过训练的分类器的置信度得分,以评估AES是否可以学习训练分布并可靠地识别其他领域的样本。其次,我们研究了AE是否能够在更具挑战性的肺病理检测任务上合成来自具有异常区域样本的正常图像。我们发现,最新的(SOTA)AES要么无法限制潜在的多种流形并允许重建异常模式,要么无法准确地从其潜伏分布中恢复输入,从而导致模糊或失误的重建。 。我们提出了新型的可变形自动编码器(morphaeus)来学习感知的全局图像先验,并根据估计的致密变形场局部适应其形态法。我们在检测OOD和病理学方面表现出优于无监督方法的卓越性能。
translated by 谷歌翻译
多价值动作推理系统(MARS)是一种基于自动价值的人工代理(AI)的道德决策模型。鉴于一组可用的行动和基本的道德范式,通过使用火星,可以确定具有道德上首选的行动。它可用于实施和建模不同的道德理论,不同的道德范例,以及在自动实践推理和规范决策分析的背景下的组合。它也可以用来模拟道德困境,并发现导致所需结果的道德范式。在本文中,我们对火星进行了凝结的描述,解释其用途,并将其置于现有文献中。
translated by 谷歌翻译